#中國 AI
允許梁文鋒再「偉大一次」
一個技術理想主義者,如何被中國AI的“工程現實”重新定義。過去幾年,梁文鋒幾乎拒絕了所有網際網路時代熟悉的劇本。別人融資,他拒絕;別人搶入口,他開源;別人卷參數,他卷效率;別人把AI當成生意,他卻一直在談AGI。DeepSeek因此看起來更像一家“研究機構”,而非創業公司。直到2026年春天,事情開始變化。GPT-5.5發佈不到24小時,DeepSeek-V4預覽版上線。發佈後不到五天,接連三次降價,昨天,DeepSeek“識圖模式”又開始灰度測試,補上了多模態這塊缺失最久的拼圖。DeepSeek多模態團隊研究員陳小康在X上的發帖與此同時,那個長期拒絕騰訊、阿里和頂級VC的梁文鋒,第一次主動打開了融資的大門。一邊把價格打到骨折,一邊卻伸手拿錢;一邊叫苦算力吃緊,一邊承諾還要降價,梁文鋒這位把AGI掛在嘴邊的人,是向商業現實“繳械投降”,還是在醞釀一場更大的風暴?01. “反常識”的72小時4月24日,GPT-5.5發佈不到二十四小時後,DeepSeek-V4預覽版悄然上線。沒有發佈會,就像這家公司的一貫作風:事情做完了,放出來,你們自己看。V4-Pro發佈後,最先引發討論的不是能力,而是價格。相比前代V3.2,這一次V4-Pro的定價看起來明顯更高。很多人第一反應是DeepSeek終於開始走向“正常商業化”了。但很快,事情又出現反轉。不到一天,官網低調更新價格,直接打到2.5折。隨後又一次更新:快取命中價格永久降至發佈價的十分之一。研究員甚至在社交媒體上直接打出“AGI for Everyone”的標籤,強調這是永久價格,而非促銷活動。更耐人尋味的,是官網價格頁面裡那行不起眼的小字:“受限於高端算力,目前Pro服務吞吐有限,預計下半年昇騰950超節點批次上市後,Pro價格會大幅下調。”這意味著DeepSeek公開承諾未來還會繼續降價,且這次價格下調繫結的,不再只是DeepSeek自己的技術最佳化,還有中國國產高端算力的量產節奏。與此同時,DeepSeek還啟動了成立以來的首次外部融資,目標估值從100億美元迅速抬升至200億美元乃至更高,騰訊、阿里相繼被傳洽談入局。降價、又融資,看起來很矛盾,但回看DeepSeek的發展歷程,會發現到它的野心從不只是“做模型”。過去兩年,全球大模型行業的默認邏輯一直是模型越強,成本越高,能力越強,價格越貴。OpenAI、Anthropic都建立在這套邏輯之上。但DeepSeek-V4要做的不是“賣更貴的智能”,而是不斷降低“智能”的邊際成本,實現AGI平權。這種對“邊際成本”的執念,從DeepSeek的前身幻方量化就已經開始了。2021年,當大多數科技公司還在討論AI概念時,幻方已經囤積了上萬張A100,自建了“螢火”算力叢集。在高度競爭的市場裡,成本結構本身就是護城河,這是梁文鋒在幻方時便想明白的,這套理念也被完整地繼承到了DeepSeek。DeepSeek V4-Pro約5.22美元,快取命中後進一步降至3.6美元左右。同等輸入輸出量下,GPT-5.5的API成本約35美元,Claude Opus 4.7約30美元。V4-Flash更激進,成本不到競爭對手的2%。這已經不是簡單的價格差,而是“量級差”了。“超低價”背後是模型架構、推理系統與算力調度共同最佳化後的結果。V4-Pro支援100萬token上下文,在部分長文字場景下,單token推理所需算力相比前代明顯下降,KV Cache佔用也大幅減少。過去行業處理長上下文,很多時候依賴的是持續堆視訊記憶體、堆頻寬;DeepSeek嘗試通過架構最佳化減少一部分無效計算與資源浪費。當然,效率上的突破並不等於全面超越。DeepSeek內部的真實評測顯示,V4目前已成為公司員工日常使用的Agentic Coding模型,使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6的非思考模式,但與Opus 4.6的思考模式仍存在一定差距。開源和低價建立了影響力,可“一分錢一分貨”的道理,在頂級閉源模型身上依然成立。某種程度上,V4真正改變的,其實不是模型能力,而是行業對“智能應該值多少錢”的認知。極客肖恩·多納霍在Facebook發帖稱,自己把部分程式設計工具切換到DeepSeek之後,月帳單下降了90%以上,效果卻並未明顯下降。科技博主 Simon Willison 每次 DeepSeek 發佈新版本,他都會用同一句提示詞 生成一張鵜鶘騎自行車的 SVG。這次也一樣,測試之後他稱DeepSeek-V4-Pro 是“大型前沿模型中最便宜的一款”。上:DeepSeek-V4-Flash 版 下:DeepSeek-V4-Pro 版這幾位開發者或許只是個例,但他們背後折射出的趨勢值得關注:當價格差拉到“量級差”,開發者重新分配算力預算的動機也會增強。而當越來越多應用、Agent和開發工具開始基於同一種模型生態建構時,真正形成護城河的,未必只是模型能力本身,還包括開發者習慣、呼叫路徑以及整個生態的成本慣性。Deepseek想用極致的性價比,成為那個被開發者“持續依賴”的選項。02. DeepSeek 的“二度奇襲”2025年1月,Deepseek R1發佈,引發全球震動。Deepseek應用很快登頂蘋果中國和美國地區App Store免費榜首,Nvidia單日市值蒸發約6000億美元,美國風投家馬克·安德森稱之為AI領域的"斯普特尼克時刻"。一個杭州的量化團隊,用560萬美元的訓練成本,做出了對標OpenAI頂級模型的效果,並且開源了。彼時,世界對梁文鋒的理解,是"用更少的錢做更好的模型"。很多人後來把R1理解成“受限條件下的逆襲”,但其實並不完全精準。早在行業真正意識到大模型價值之前,幻方就已經開始大規模採購算力、建設叢集。後來外界看到的“低成本奇蹟”,更像一次長期積累後的集中爆發。梁文鋒真正厲害的地方,是他比大多數人更早意識到未來AI競爭的核心,不只是模型能力,還有算力效率。但隨著DeepSeek從技術黑馬變成核心玩家,新的問題也開始浮現。過去的DeepSeek,很像一個隱秘的研究組織,幻方量化在背後輸血,梁文鋒不缺錢,研究員埋頭做模型。Deepseek在X上的簽名都是“用好奇心揭開通用人工智慧的奧秘,用長遠的眼光回答根本問題”,學術味兒十足。但AI行業不會長期尊重“隱士”,尤其當你手裡真的有“真經”的時候。從2025年底到2026年,多位DeepSeek核心成員相繼離開。V3架構關鍵開發者羅福莉去了小米,第一代大語言模型核心作者王炳宣去了騰訊,R1核心研究員郭達雅被字節跳動以傳聞中“近億元的總包”帶走,多模態方向核心研究員阮翀轉投元戎啟行。過去,大模型公司的目標相對統一:訓練更強的基礎模型,到了2026年,行業開始迅速分化,Agent、多模態、端側AI、機器人、自動駕駛,陸續變成新的戰場。這時候,一個研究員如果想做Agent,去字節會面對真實月活場景;想讓AI理解物理世界,去自動駕駛公司顯然更有吸引力。DeepSeek太專注把模型本身做到極致,這種組織文化,能夠吸引最純粹的研究者,卻很難長期承載所有方向。它最強的地方,在這一刻成為它最大的桎梏。主流AI公司搶的是有經驗的工程師,梁文鋒卻更青睞頂尖高校的年輕博士生,因為在他看來這些人"渴望證明自己","可以完全不帶功利地投入去做一件事"。初期DeepSeek的確可以用技術理想主義吸引天才,但很難長期用理想主義支付機會成本,尤其在同行已經開始形成市場估值的時候。近兩年,OpenAI、Anthropic不斷刷新融資數字,投後估值高達8400億、3800億美元,國內的智譜、MiniMax相繼掛牌港交所,市值一度突破4000億和3800億港元。大廠給的是有行權價、有IPO預期、有內部回購機制的期權,而不融資的DeepSeek,沒有“度量衡”。在競爭白熱化的AI人才市場裡,沒有市場化估值錨點的期權,等於一張無法兌現的期票。梁文鋒或許也是意識到了這一點,所以開放了融資。但這依然是一個極具“梁式色彩”的融資方案。此次融資目標募集金額不低於3億美元,計畫以不低於200億美元的估值進行。與此同時,工商資訊顯示,梁文鋒在增資後直接持股佔比由1%提升至34%,其作為實際控制人的最終受益股份仍為84.29%,表決權比例仍為100%。他用大約3%的股權,換來了市場對這家公司的價值認證。董事會的控制權,一票未讓。對比同行,這個數字更加意味深長。OpenAI 2026年完成的最新一輪融資,募集1220億美元,投後估值8520億美元;Anthropic 2026年2月完成300億美元G輪融資,投後估值3800億美元。3億美元,放在今天的AI賽道里,甚至比不上同行一輪融資的零頭。梁文鋒選擇用這個體量融資,就是為給員工手中的期權,建立起相對清晰的估值錨點和兌現預期,穩住人才,同時讓公司不被短期增長所裹挾。03. 允許梁文鋒再“偉大一次”R1證明了中國AI可以做出世界級模型,V4之後,梁文鋒試圖證明中國AI可以建立起自己的“底座標準”,那怕這條路,很難。有個細節,V4發佈後,華為昇騰生態官方帳號,專門為DeepSeek-V4做了一場直播。晶片廠商親自下場給一款模型站台,並不常見。它釋放的訊號超出產品本身:DeepSeek第一次公開地,把自己的模型路線與國產算力的量產節奏綁在一起。過去幾年,中國AI行業有個默認順序,模型可以開源,演算法可以追趕,但輝達的生態護城河最難撼動。CUDA是輝達二十年攢下的工具鏈、算子庫、開發框架和開發者習慣,全球AI幾乎默認運行在這套底座之上。要脫離它,可不是“換塊顯示卡”那麼簡單。尤其在兆級參數模型上,難度會被進一步放大。參數越大,對視訊記憶體頻寬、通訊效率、叢集穩定性的要求就越高。模型團隊不僅需要針對國產晶片重寫和最佳化核心算子,甚至還需要自研確定性算子,保證長時間訓練過程中的精確可復現。更現實的問題是在萬卡叢集裡,硬體故障不是意外,而是必然。於是,訓練框架必須同時具備完整的檢測、容錯與恢復能力。如果效率跑不上去,成本就只是空談。V4延期超過十五個月,遷移代價是原因之一。目前V4的細粒度專家平行方案已經同時在輝達GPU和華為昇騰NPU兩個平台上完成驗證,在通用推理場景中實現了1.5到1.96倍的加速。推理層面跑通了,但開放原始碼主體仍基於CUDA,底層工具鏈尚未完全轉移,原因在於昇騰950超節點尚未批次上市,現有產能撐不起V4-Pro的大規模服務。不過DeepSeek已經把下一輪降價,公開寫進了國產算力的量產時間表裡。昇騰950PR單卡算力達到輝達H20的2.87倍,是目前國內唯一支援FP4低精度推理的產品,HBM容量112GB。規格是真實的,只等工業化落地。梁文鋒當年從幻方量化的GPU叢集起家,把算力當作研究的彈藥。如今他讓中國模型和中國晶片的命運,在商業上深度捆綁,並在所有人面前承諾,這是梁文鋒在晶片封鎖的現實下,做出的務實選擇。但這條路有個前提:模型能力必須始終足夠硬。V4把1M上下文做成標配、對Agent能力做專項最佳化、推出三檔推理強度,這些不是給評測榜單準備的,是給真實企業工作流準備的。只有先在真實生產場景裡證明自己不可替代,Deepseek的“底座”敘事才能成立。未來,梁文鋒和Deepseek要走的路還很長,國產算力的工業化時間表能否如期兌現,模型能力能否在閉源頂級模型高速迭代的壓力下保持競爭力,開發者生態能否形成足夠的黏性……它們像棋盤上尚未閉合的“氣眼”,每一個都關乎生死,可這些問題,現在都還沒有答案。Deepseek爆火後,被問及"商業公司做無限投入的研究性探索是否瘋狂"時說,梁文鋒曾說過一句話:"我們終其一生所渴望的,就是找到自己,然後成為自己。"這句話在R1發佈後的語境裡讀,是一個創始人的理想宣言。如今再讀,份量更重了些。AI競爭的上半場,他用技術效率、定價顛覆和算力豪賭,贏得了繼續下棋的資格,成就了Deepseek的"偉大"。下半場,允許梁文鋒再“偉大一次”,不是因為他已經攻下了某個技術的山頭,而是他正在為一場漫長的遠征搭建底座。不誘於譽,不恐於誹,率道而行,端然正己。這是荀子的精神,也是Deepseek的信條。 (奇點研究社)
“泡沫裡,人們總會說這次不一樣”
無論市場泡沫如何,其應對的核心原則是堅守價值底線。大模型的語言世界已經走向真實的物理世界,AI正在開啟新一輪的產業革命,新概念也層出不窮,一級市場的熱錢蜂擁而至,即便團隊尚小、收入微薄,估值也能輕鬆衝至百億;但另一邊,從實驗室走向真實場景,AI與物理世界的融合仍面臨著感知、決策、執行的重重關卡,技術落地道阻且長。4月24日,在“第20屆中國投資年會・年度峰會”上,國科嘉和總經理、執行合夥人陳洪武,天創資本洪雷,聚合資本創始人李旺,中關村原生引擎總經理馬建平,九合創投創始人王嘯,遠毅資本楊瑞榮,這批國內一線硬科技投資機構“話事人”,圍繞“投資於‘AI走向物理世界’的處理程序”這一主題,展開了一場精彩的巔峰對話。陳洪武在風險投資行業深耕20餘年,長期聚焦科技領域投資,他認為,具身智能對物理環境的多維度感知與動作決策,複雜程度遠超自動駕駛,短期內行業難實現全場景突破,核心將聚焦特定場景的技術最佳化,具備真實落地能力、能解決真問題的企業具備長期投資價值。同時他也指出,當前具身智能賽道估值泡沫顯著,無團隊、無收入的項目估值高企,對創業者是福音,對投資則禍福相依。他認為泡沫是產業發展的必經階段,建議企業把握窗口期多融資、嚴控燒錢節奏,投資端則需理性看待估值快速上漲。天創資本先後佈局中科曙光、智譜、kimi等AI產業鏈核心項目,在智能類股形成了系統化佈局。洪雷表示,3年內大模型對物理世界的感知理解仍有較長路要走,AI走向物理世界將遵循從實驗場景到結構化、半開放場景,最終實現泛化的漸進路徑,核心硬體、VLA與世界模型領域具備長期投資價值。在洪雷看來,資本市場的熱度波動與泡沫是行業常態,當前AI具身賽道的火熱與此前科創板牛市的周期規律一致。應對泡沫的核心策略,是“往前多走半步”,平衡機會與估值,在市場形成共識前提前佈局,同時引導被投企業儲備充足現金、穩健發展。聚合資本由華為、中興、比亞迪核心成員發起成立,深耕科技產業生態投資,已佈局星動紀元、松延動力等具身智能明星項目。李旺認為,3年內AI走向物理世界難實現全場景泛化,將率先在物流等簡單標準化場景落地突破,家庭、複雜製造業場景成熟仍道阻且長,最具投資價值的是具備全端技術能力、能實現漸進式場景落地的企業。他明確表示,當前熱點賽道已形成高度共識,存在顯著的結構性泡沫,雖對產業長期發展有利,但對投資回報形成挑戰。其應對策略為上半年完成賽道核心佈局後,將轉向科技出海等價值窪地,整體保持謹慎樂觀,在市場高熱度階段逐步收緊投資節奏,規避估值泡沫風險。中關村原生引擎是集孵化與投資於一體的平台,馬建平提出,AI走向物理世界可分為in AI、for AI、be AI三個層次,3年內前兩者將迎來大量落地機會,對於be AI的具身智能落地核心要打通資料閉環、多感測器融合、量產三大環節,均具備極高投資價值。對於市場泡沫,馬建平認為其是多方情緒共振的結果,只有價格嚴重偏離價值才是真正的泡沫,能解決真問題、可落地量產、有真實收入的企業,估值溢價並非泡沫。他表示,應對泡沫要做清醒的樂觀主義者、冷靜的長期主義者、堅定的價值主義者,堅守價值投資,鎖定技術源頭,深耕投前投後服務。九合創投專注早期科技投資16年,累計投資三百余家科技企業,在工業機器人、具身智能、端側晶片等領域早有佈局,投資了自變數機器人、地瓜機器人等明星項目。王嘯判斷,3年內AI走向物理世界將率先在工業場景實現規模化落地,家庭場景成熟至少需要3-5年,行業核心門檻集中在資料積累、世界模型迭代、端側算力升級、本體成熟四大方向,均存在優質早期投資機會。他分析,本輪泡沫由美股科技股估值抬升傳導而來,結構性泡沫客觀存在,如果泡沫持續時間長,更有可能誕生偉大企業,需警惕渾水摸魚、純炒估值的項目。他認為VC的本質就是投資預期與夢想,天然與泡沫相伴,應對核心是不被市場情緒裹挾,堅守商業本質與項目基本面,通過組合投資平衡風險。遠毅資本專注數字醫療領域投資,累計佈局七八十家AI與數字醫療相關企業,在醫療AI、手術機器人等賽道有著深厚的產業積累。楊瑞榮指出,醫療領域AI走向物理世界,3年內難實現通用具身智能落地,核心將聚焦單病種、單場景的小閉環應用突破,具備單病種資料閉環、能與醫療硬體深度融合的AI技術企業,具備核心投資價值。他表示,每一輪技術革命都會伴隨泡沫周期,本輪AI熱潮中,“這一次不一樣”的論調正是最需要警惕的泡沫訊號。無論市場泡沫如何,其應對的核心原則是堅守價值底線,聚焦醫療領域能真正創造臨床價值、為患者帶來實際獲益的項目,拒絕純概念炒作的標的。3年,AI走向物理世界怎麼落地?張楠:各位上午好!感謝大家來參加投中的年度峰會。我是投中網的副主編張楠。大家手裡都有一個牌子,後面有個環節,6位嘉賓要互評一下,覺得那位嘉賓說得最真實、最是心裡話,就給他投一票,我們最終會評出本場的MVP。今天我們的主題是“投資於‘AI走向物理世界’的處理程序”,不知道大家怎麼看這個話題,反正我乍一聽有點抽象。為什麼?因為從2015年開始,我就感覺AI已經在走向物理世界了,當然,2015年的AI和今天以AI大模型為基礎的AI,不是一回事。現在LLM已經解決了基本的理解問題,但是現實世界還有很多未解決的問題。我想問各位的第一個問題是,你們怎麼理解AI走向物理世界的具體過程?我們不聊10年、20年、30年之後的事,想5年的事都已經很難了,就聊3年。你們覺得3年之內,AI走向物理世界是怎麼個過程?能解決什麼問題?順帶說一下,你們認為那一個環節的投資價值是最高的?大家也可以先簡短介紹一下自己。先請洪武總。陳洪武:大家上午好!我是國科嘉和總經理陳洪武,在風險投資行業幹了20幾年,國科嘉和自成立以來一直專注於硬科技領域的投資。剛才主持人問的AI和物理世界的關係問題,是當下最受關注的行業風口。現在這個領域裡,各種新概念層出不窮,具身智能是當前市場的熱點。這個賽道的估值,在我的投資生涯裡還沒見到過——很多企業在還沒有多少團隊人員、也沒有實質性收入的時候,估值就能喊到100億,即便如此,依然有大量投資人趨之若鶩。這種情況對創業者來講是福音;但從投資角度來講,是禍福相依的。畢竟創業的成功率就擺在那裡,不可能所有企業都能走到最後。回到物理世界的話題,我們投資的馭勢科技,剛剛順利過了港交所的聆訊。他們主攻自動駕駛領域,核心要解決的問題就是精準評測車輛周邊環境,確保車輛不發生碰撞。但即便只是這樣一個看似簡單的目標,落地起來依然很困難。在和創始人交流時他也坦誠表示,要實現真正意義上的完全解放雙手、不需要人類干預、完全自主可控、機器自主營運,未來至少還需要十到十幾年的時間。機器解決真實物理世界的複雜場景,難度遠比我們想像的要高。對機器來講,所有決策本質上都是基於統計分析得出的,而真實世界裡要解決的變數、應對的突發情況實在太多了。現在的具身智能,更是要對物體的材質、大小、形狀、軟硬程度、顏色等每一個維度都做出精準判斷,再決策自身的動作,其複雜程度比自動駕駛要高很多。當然,可以想像,一旦這項技術真正實現突破、成功攻克,它能創造的價值也將是不可估量的,當然難度也同樣巨大。這個領域不斷有新技術迭代,從原來的“VLA(Vision-Language-Action)”到現在的“世界統一模型”,幾乎每一個新概念出來,都會引發行業內的廣泛關注和熱烈討論。但客觀來講,一個技術從提出概唸到最終落地、形成真正可用的產品,還有很長的路要走。我很看好這個領域的技術發展,也知道未來機器能幫我們解決問題、帶來巨大價值,但到底什麼樣的技術算真正成熟、真正具備實用價值,還有待我們從業者一起探索和驗證。我先說這些,把時間留給其他嘉賓。張楠:謝謝洪武總,說得很謹慎很藝術。我們邀請洪雷總。洪雷:大家上午好!我是來自天創資本的洪雷。天創資本在投資圈做了超過20年,始終致力於硬科技方面的投資,智能類股是我們最重要的佈局方向。我們十多年前參與了中科曙光的投資,之後投了一系列晶片企業,過去兩三年,在人工智慧領域參與了kimi和智譜的投資,目前還在緊密觀察智能領域的進展和變化。今天的主題是個非常宏大的問題,AI如何走向物理世界,我們全行業都很關心。剛才陳總也說到了它的巨大意義,這一點已經取得了社會、國家和資本市場的共識。剛才嘉賓們也在聊,現在一級市場的火爆程度不亞於二級市場,我們的選擇也相對比較謹慎。主持人讓我們只聊近3年,那我就聚焦這個周期。近3年,我們能看到大模型真正理解我們的感官世界還有很長的路要走,現在它只是從字意上、機率上實現了人工智慧,對於物理世界的溫度、大小等屬性,它的感知還有很多功課要補。從感知-決策-執行,這是一個非常複雜的工程問題,需要大模型不斷演進,同時還要完成工程化落地,所以這個題目難度非常高。未來3年,我們更關注這樣的團隊:既能拿到足夠多的社會資源、做好募資,同時創業時還能保持長期主義心態,真正沉下心解決問題。因為這個問題不是一瞬間就能解決的,必然要從實驗場景,走向結構化場景、半開放場景,最終實現泛化,每一步都需要硬功夫。說到我們關注的方向,從核心零部件硬體,再到VLA、世界模型,長期來看都有很大潛力。在這一領域,我們今年有兩家企業上市,一家是杭州易思維,這是一家天津大學孵化出的科技型企業,做工業場景化視覺;另一家是智譜,其實這條路很長遠,也有大量機會,希望大家都能抓住。謝謝。張楠:謝謝。智譜、MiniMax在市場上的表現大家有目共睹,核心還是有底層token消耗量的確定性在裡面。有請李總。李旺:大家上午好,我是聚合資本的創始人李旺。我們來自深圳,聚合資本是強產業背景的投資團隊發起成立的,核心成員來自華為、中興、比亞迪,所以我們的投資風格也是沿著科技產業生態做佈局。基金創立快6年,在市場站穩了腳跟,做了比較系統的科技生態佈局。今天的主題是AI走向物理世界,剛才幾位嘉賓也聊了,這確實是當下行業最熱的話題,也是資本市場的共識,過去半年相關標的估值漲幅非常大。在這個問題上,行業似乎有很大共識,但我們團隊雖然看好長遠方向、看到行業趨勢在加速,可對落地這件事還是偏保守的。去年上半年我就在看這個領域的項目,帶著團隊去了比亞迪、小米的智能製造工廠,當比亞迪和小米給這些項目一些場景任務時,它們基本都接不住。但今年再看,行業已經有一些場景逐漸落地了。比如星動紀元,我們也參與了投資,看到它最近在物流場景實現了落地,效率能達到人的80%,這種長時間枯燥的工作,能做到80%的人效,同時精準率達到90%以上,這比我們預期的速度要快。我們認為這是個好現象,說明行業在加速,具備全端能力的企業,一旦在相對簡單的場景落地,會給行業打開新的天窗。但同時我們也看到,很多做具身大腦的項目,想進入家庭、酒店、製造業場景,我們覺得這條路還很遠。智駕走了20多年,現在基本剛做完L3,當然美國Robotics已經能做全端了。今天的具身智能,要實現泛化場景,難度是數量級增加的,不只是一個數量級的提升,我們認為路徑會非常難。它的落地路徑,一定是先在相對簡單的場景實現突破,能在簡單場景落地的企業,才會逐漸成為行業的勝出者。聚合資本也投了幾個項目,比如北京的松延動力,我們對它的定義很簡單,就是一個大玩具,但它把成本做得更低,比早些年的具身智能有更強的科技屬性;還有就是星動紀元。最近我們在看深圳一個華為出來的早期團隊,他們做家電場景,沒有提終極解決方案,而是走漸進式路線,認為要把全球創客集中在一起共創場景,我們反而覺得這種漸進式的模式更符合行業發展規律。一上來就想解決某個具體場景的全能力問題,還是太遙遠了。理想是遠大的,但路徑是曲折的,不可能一帆風順。所以今天,對創業者和投資人都是考驗,這是我的理解。張楠:聚合有很深厚的硬科技產業背景。下面有請馬總。馬建平:各位好,我是中關村原生引擎的總經理馬建平,可能大家對我的身份好奇,其他都是投資機構,怎麼來了個企業。因為我4月份從啟航投資調到了集團的原生引擎,原來只干投資,現在不僅要干投資,還要干孵化,所以中關村原生引擎是既要干孵化、也要干投資的平台。聽前面幾位嘉賓分享,我感觸很深,我們從2010年前後開始做投資,投了350多個項目,跟具身、AI相關的差不多有100個。今天這個話題很有意思,我拿到的時候就在想,AI走進物理世界,要分開三個層面看。第一個,是in AI的機會。現在AI已經成了共識、成了底座,未來三年,傳統企業怎麼擁抱AI、轉型AI化,是很重要的機會。第二個層面,是for AI的機會。你能為AI做什麼?有人說做資料採集不行嗎?這個事當然香。特種場景的資料能賣到八九千塊錢一條,北京的某個資料採集廠,一條資料也得十幾塊錢。所以for AI的過程中,未來3年有非常多能落地的機會,像松應這些做素材的企業,增長和估值都非常快。我認為最難的是第三個層次,be AI,你能不能做成一家真正的AI公司。是做垂類模型、基礎大模型,還是真的做一家具身企業,現在有很多技術變種,包括超級OPC、OPU、OPD等等。未來,inAI是普適性的,只要擁抱AI,都有被投資的機會;forAI是做細分賽道,要想清楚你的客戶是誰、產品賣給誰;最難的還是be AI,怎麼讓自己成為真正的具身公司,走進物理世界。2017-2018年我們投機器人的時候,根本沒有具身的概念,大家只說工業、服務、特種、協同機器人,我們投的博清科技做銲接機器人,史河做高空清洗索並聯機器人,博雅工道做水下機器人,艾力特的協作機器人,靈動的搬運機器人,國廣順能的充電機器人,最近投的月泉做仿生機器人,其實它們早就走進了物理世界,只是當時沒套上具身的概念,大家只覺得它是個能幹活的機器人本體。現在具身這個概念,是AI走到物理世界特別好的載體。前段時間我跟團隊分享,AI走到物理世界,具身智能要打通三個核心環節:第一個是資料閉環,網際網路的公開資料已經被LLM用完了,具身智能需要的真實世界資料,必須高品質採集上來,否則機器人擰不開瓶蓋、穿不了針、引不了線。我還給項目方出了主意,就該把機器人放到技工學校,跟藍翔合作,去採集最標準的具身運算元據。第二個,是和資料採集配套的感測器融合落地。要採集真實世界的資料,感測佈局必須到位,是多感測器融合還是單一感測器,邏輯和自動駕駛是一模一樣的。沒有多感測器融合的合成資料,具身智能走不遠。最後一個是量產。所有AI加到具身機器人身上之後,最大的問題,是能不能用高性價比的方式量產,讓它走進千家萬戶、工廠、學校、我們的生活,這才是真正走到了物理世界。當然我說的不全,資料、感測器、本體,未來三年都有機會。現在市場的熱鬧,是大家把未來的機會和期望值,折現到了現在,去投當下的項目。最後說說原生引擎在做的事。我們承接了教育部全國高校人工智慧區域技術轉移轉化中心,能給大家提供更早期的原始創新技術,把它變成可落地轉化的機會、可投的項目,涵蓋資料採集等各個模組。也歡迎在座的投資機構、合作夥伴,未來有機會一起合作。謝謝大家。張楠:謝謝馬總,有請王嘯總。王嘯:大家好,我是九合創投的王嘯,我們做早期投資15年,投了三百多家公司,主要聚焦科技領域,具身智能和世界模型我們一直在看、很早就有佈局。九年前我們投了一家工業機器人公司,現在已經進入富士康的工廠,和人協同做上下料、基礎操作,其實具身走入物理世界早就開始了,只是我們期待的、能全自動自主思考、長周期完成家庭任務的最高級機器人,目前還沒真正實現。我們天使階段投的自變數機器人,馬上要把機器人放進家庭收集資料了,現在正在招募志願家庭,已經開始向難度最大的家庭場景、完全自主機器人的高峰攀登。我認為,從資料收集到世界模型建立,到家庭場景適配,再到機器人最佳化和價格普及,這個過程至少需要三年甚至五年,才有可能性,中間要邁過的門檻非常高。第一個門檻是資料。網際網路上存在的資料,具身智能基本用不了,這個領域需要大量的場景化資料,而且每個機器人不一樣,不同機器人採集的資料最後能不能適配新的機器人,也要打個問號。高品質、複雜場景、長周期的資料收集,是目前最難的。第二個門檻,資料收集之後,現有的大模型架構,沒辦法很好地處理時空資料。大模型處理的資料,本質上是沒有時空屬性的,語言模型最大的問題,就是“一根三米長的竹竿能不能通過一扇門”這種問題,它都有可能會答錯,因為它沒有時空概念。現有的大模型升級到世界模型,從LLM到世界模型的過程中,整個演算法需要大規模迭代,而且目前技術路線還沒有統一。有人從視訊起步,有人從語言模型+圖像識別起步,有人直接從機器人起步,有人從因果模型起步,這些路線最後都會融合,但融合的過程還需要兩年時間,才能看到技術路線的統一,和能真正解決問題的世界模型的誕生。除此之外,還有端側計算能力的提升。這些模型需要在一秒內做出判斷,現在機器人的動作都很慢,加倍速之後才看起來像正常速度,核心就是端側推理晶片的算力明顯不夠,也不一定符合具身模型、世界模型的算力要求。端側這個方向,我們投了地瓜機器人,和一家做端側NPU晶片的公司。第四個門檻是本體。本體大家做得很多,但真正能適配家庭場景、低成本、高可靠、能完成基礎任務的本體,還沒有實現規模化出貨和銷售。大腦還沒成熟,本體需要適配大腦、適配環境,靈巧手這些部件也沒成熟,本體自然也沒成熟。從這四個角度來說,四個方向都有投資機會,目前還沒有成建制的龍頭公司,都還有創業公司的機會,我們也都做了佈局,包括華為“天才少年”的項目、松延動力、自變數,端側晶片有地瓜和另一家企業,我們一直在沿著這個思路佈局。我們最早還投了工業方向機器人,我覺得工業場景最容易落地,場景簡單、標準化程度高,重複性工作多,我們投的那家工業機器人公司已經有規模化收入了,今年預計五個億的收入,已經算是具身領域裡有規模化收入的標的。反過來看,AI走入世界,從自動駕駛就開始了,我們十年前也投了Momenta這樣的公司。甚至最早進入物理世界的,是人臉識別,現在過個門都要人臉識別,那時候AI就已經走進物理世界了。掃地機器人、割草機器人也早就走進了物理世界,背後都是AI演算法在支撐,不然沒法實現自動清掃。AI進入物理世界,包括我們手上戴的各種感測器,告訴你睡眠、休息情況,這些都和生活息息相關。但真正讓大模型完成自主決策、有自主意識、完成高複雜任務,還需要很長時間,三年是非常樂觀的預期,五年是更中性的預期。張楠:謝謝,前幾天自變數的發佈會我也去了,我也特別期待家裡能有一個幫我掃地、洗碗、洗襪子的全能機器人,泛化能力的實現,真的需要非常長時間的資料積累。有請楊瑞榮總。楊瑞榮:大家好,我是遠毅資本的楊瑞榮,我們專注在數字醫療方向,一直在研究AI和大模型在醫療領域的應用,過去投了七八十家跟AI和數字相關的企業,從技術投入、數位化疾病管理到創新支付,全鏈條去改善醫療環節。從我個人的感受來說,大家聊的大模型和具身智能之間,其實是有割裂的:大模型是大模型,所謂機器人大部分還只是簡單的工具,真正能實現具身智能的機器人,離得還很遠。我們在醫療領域投了手術機器人等一系列帶智能屬性的產品,但它們和大模型沒關係,只和AI有一定關聯。我們投的AI影像、AI腔鏡手術相關產品,包括AI製藥、合成生物學、類器官,都和智能有關係,但理論上的智能,和實際上的具身落地,還是有很大差距。尤其是從網際網路大模型走向具身智能,在醫療領域,我認為有兩個非常大的門檻必須先突破,我對未來的判斷,比王嘯總還要悲觀一些。我理想中醫療領域的具身智能終極形態,是家裡有個機器人,不只幫你掃地,還能在你睡覺的時候,把你身上的病全治好,這個景象,我在十年、五十年、一百年之內都看不到。問題在那?兩大核心門檻。第一個就是大家反覆提到的資料。現在大語言模型能在網際網路領域實現巨大突破,核心是有海量的公開資料。大家可以想想,生活裡的各個場景,你的社交、消費、金融、出行資料,不管你願不願意,其實都已經被分享了。但醫療領域不一樣。我可能是在場把醫療資料做到極致的人,我身上戴著智能戒指、智能手環、智能運動手錶,還有很多裝置能夠收集資料,同時我還能夠把自己的醫療資料都整合在一起。但即便如此,能真正被大模型、被具身智能所用的醫療級資料,還是非常少。就算是在美國,醫療資訊化系統做得很強、行業高度集中、系統相對互通,醫療資料的可用性依然非常低。在中國,有國家隱私保護法規,醫院體系對醫療資訊的保護門檻是最高的,這就成了最大的壁壘,大部分醫療資料根本沒法用。普通人的健康資料,運動、睡眠、飲食、心理、社交資料,要和院內的診療資料、甚至體檢資料結合起來,都非常困難。只有當所有資料整合起來,每個人都形成完整的資料閉環,醫療資料的應用才能進入好的狀態,才能被具身智能所用。現在連基礎的診療環節都還沒做到,這是第一個最大的門檻。第二個最大的門檻,來自於監管。我說的監管是廣義的,不只是批藥、批器械、批醫護資質。在技術發展的過程中,有個詞叫Human in the loop,擁護和反對的人都非常多。所謂的人工智慧,是脫離人之外的智能,那人在裡面的干預到底該是什麼樣的?有個反對Human in the loop的美國漫畫:汽車剛發明的時候,所謂的人為干預,就是一個人站在汽車前面,控制它的速度跟馬車差不多,防止它撞人。其實現在很多監管,在Human in the loop這件事上,起到的就是這個作用,在安全環境裡不敢放開,反而限制了行業發展。這在醫療領域更是如此,醫療出不了事,一出事就是人命關天的大事,還會涉及嚴重的倫理和道德問題。這兩大門檻疊加,導致醫療領域裡,大模型走向物理世界的具身智能,還有非常長、非常難的路要走。那落地路徑是怎樣的?我們也做了很多探索。醫療領域的AI和具身智能,和其他行業的落地路徑完全不一樣。從我們的經驗來看,它不是靠一個最大的通用模型就能實現的,現在醫療AI裡,真正實現落地、產生巨大商業價值的,不管是AI影像、手術機器人,還是單病種病理分析,都是單病種、單場景的,是一個一個的小閉環。先在一個細分疾病領域,集中最核心的資料,再從文字智能,走向物理智能。拿手術機器人舉例,它可能是醫療領域最像通用行業具身智能的產品,但現在,那怕是全球最頂尖的達文西,或是國內的天智航,都只是一個工具,沒有智能,因為它沒有後端的資料閉環。我們在四川天使投了一家企業,專門做腔鏡下手術人工智慧,積累了大量的手術資料,現在正在和全球頂級的手術機器人合作。有了我們的演算法和資料,手術機器人才有了大腦,才能真正往具身智能的方向走。只有一個一個的小場景形成小閉環,才能為未來的通用醫療具身智能,打下基礎。資料是最大的門檻,因為我們永遠不可能實現手術室全場景、全物理空間的資料全覆蓋,這是永遠做不到的。未來只有先把垂直疾病領域的小步AI做好,才能真正走向具身智能的長遠發展。謝謝。泡沫,這次會不一樣嗎?張楠:謝謝楊總。不管是醫療方向,還是具身智能,乃至AI走向物理世界的整個處理程序裡,資料都是一個核心的關鍵點。時間關係,我們直接進入下一個問題,這個問題昨天和前天的會場上,也有很多嘉賓隱晦地提過,我們就開門見山,聊跟市場最相關的話題。大家覺得現在市場上有沒有結構性的泡沫?泡沫體現在那裡?為什麼這麼判斷?以及,你們是怎麼應對的?時間關係,希望大家儘量簡短。為什麼提這個問題?比如昨天毅達的應總說,他在2024年中開了戰略會,強制要求團隊必須把錢趕緊投出去,大家都知道,2024年7、8月是市場的低谷,之後才有了“924”行情。剛才私下交流,王嘯總也說,去年春節之前,他就催著團隊趕緊投、趕緊定項目,因為預判到了後續市場的火熱。所以回到問題,泡沫到底有沒有?有的話在那?你們怎麼應對?現在還投不投?我們還是從陳總開始。陳洪武:現在這個階段對具身智能創業者來說無疑是好時機,只要核心團隊具備技術背景、做好專業打磨與合理包裝,就能高效對接資本、順利完成融資,這個窗口期對創業者非常友好。但泡沫要分兩面看,就像買彩票,市場平均回報率其實很有限,為什麼還有這麼多人衝進來?因為萬一中了頭獎,回報是幾十萬倍、上百萬倍的。在投資裡也是這樣,當某個賽道出現泡沫時,很多人明知道風險很高,依然選擇進場,不只是為了理性計算下的平均回報,更是為了不錯過那個“萬一中了頭獎”的機會。泡沫在某種意義上,是市場在為可能性定價,為不確定但具備巨大潛力的未來買單。從整個社會的角度看,任何新興產業最終格局定型、誕生龍頭企業的過程,必然伴隨優勝劣汰,腳下一定是一片“屍體”,這是所有科技產業發展的客觀規律。現在資源大量湧進這個領域,會給產業發展注入充足養分,成為技術迭代與落地突破的重要催化劑,加速行業整體成長處理程序。也希望我們的從業者能抓住這個機會,謹慎看待市場裡的熱錢,把握窗口積極融資,同時精細化管控成本,合理規劃燒錢的節奏。眼下行業行情向好,但兩三年後的市場環境充滿不確定性。參考Gartner曲線,當前行業正處在泡沫膨脹的上行階段,但頂峰之後的回呼深度,沒人能夠預判。總體來說,就是把握現在的好時機,多融錢,少花錢。謝謝。張楠:謝謝陳總,昨天也有嘉賓提到,建議被投企業現在能融趕緊融,最好能融到2030年夠花的錢,這個規劃確實非常長遠。有請洪雷總。洪雷:市場確實很火,說到泡沫,我們的理解是,這個話題其實並不新鮮,資本市場永遠是處於波動的狀態。就像2022年疫情期間,科創板行情火熱,天創資本在那一年有4個項目上市,很明顯是牛市,當時我們就預判,市場總會有關門的時候,很快就迎來了兩年的靜默期。現在市場又火了,波動是永遠的常態。問到VC怎麼應對,其實答案是不變的,我們永遠要在產業發展前半步做投資,永遠在平衡機會和價格。真正想參與硬科技投資的,都可以和我們多交流。比如2023年,OpenAI帶來了行業巨變,我們就決定必須重點關注這個領域,包括AI延伸的人形機器人、具身智能,都要深度跟蹤,2024年必須出手,不出手就來不及了。王嘯總投了松延,我們投了加速進化和逐際動力,都是那個時間段佈局的,現在就相對輕鬆。也和陳總一樣,勸被投企業多拿錢,少花錢,平穩落地。謝謝。張楠:還是要在產業和市場形成非共識的時候果斷出手,通過資產配置平衡風險。有請李總。李旺:這肯定是大家現在都面臨的問題。投資的最佳方案,是“投在無人問津處,退在人聲鼎沸時”,但這件事太難了,大家都在這個產業裡,很難做到世人皆醉我獨醒。毫無疑問,今年這幾個熱點賽道,已經形成了高度共識,肯定有結構性的泡沫。這個泡沫對創業有利,對產業長期發展也一定有利,中美都是如此。但站在投資機構的角度,我們不是做慈善,還是要給基金、給LP創造超額回報,所以應對策略,取決於每家機構的不同定位。站在聚合的角度,去年到今年上半年,我們還是處於加速投資的過程,2024年也是我們的重點投資年份。但我估計,這幾個熱點賽道,今年上半年投完,我們可能就會收手。同時我們也看到了其他的價值窪地,比如出海,我們團隊在深圳,有很多科技出海的項目,雖然也有一點泡沫,但遠比現在這些熱點賽道小得多。這些企業本身就是為了商業落地,很快就能形成商業閉環,項目反而更紮實。一個機構在不同階段,要有不同的投資組合,中國的科技產業生態足夠大,東方不亮西方亮。第二點,還要看二級市場,包括美國市場的後續走勢。如果今年二級市場橫盤甚至向下,估值回呼會來得更快,這也是我們重點關注的。總體來講,我們還是謹慎樂觀,現在已經到了高風險階段,所有機構都會比較難受,我們今年也會越來越謹慎。張楠:謝謝,一級市場的二級化,也是現在大家非常關注的問題。有請馬總。馬建平:大家說得都非常好,我分四個層面來理解這個事。第一,什麼是泡沫?我認為泡沫是多種情緒的共振疊加。我其實一直覺得有泡沫不是壞事,當國家的支援力度、機構的認可度、企業的賽道選擇、老百姓的接受度,這幾方認知一致、對大勢判斷一致的時候,就會形成同頻共振,自然就會出現所謂的泡沫。第二,到底是不是真的泡沫,核心要看價格和價值。當價格嚴重偏離價值,那才叫泡沫;如果價格沒有偏離價值,那就是正常的價值回歸。怎麼判斷價值?我跟清華的老師們交流,有句話特別重要:你是不是真解決了一個問題,解決了一個真問題,有抓手、能落地、能量產、有收入。能做到這些的企業,就是真正有價值的,給這樣的企業和技術多一點估值溢價,完全沒問題,能鼓勵大家創新,推動科技成果轉化。第三,我對創投的理解,創投就是創業服務+非共識投資。大家看到投資人光鮮的一面,都是做了非共識投資,比如我投了迅策,從沒人看懂的階段投進去,現在估值1000多億,賺了很多倍。但非共識從那來?其實是靠大量的投前服務,鎖定了技術的源頭。非共識投資這個動作只佔10%的工作量,剩下90%時間都是投前和投後的服務。第四,我一直跟團隊、跟被投企業說,不要怕泡沫,送給大家三句話:第一,要做清醒的樂觀主義者,市場狂熱的時候,要清醒判斷價格和價值是否匹配;第二,要做冷靜的長期主義者,任何一次創業、一次成果轉化,沒有10年左右的打磨,很難上市、給市場一個交代;第三,要做堅定的價值主義者,投資的本心,永遠是投價值,不管什麼賽道、什麼技術,核心都是能不能解決真問題。總結下來,只要能做到這三點,泡沫並不可怕。張楠:謝謝馬總,非常樂觀。我想到昨天一位嘉賓說,他最後悔的事,是2015-2016年,沒有著眼於解決國家急需問題的公司,反而投了市場追捧的標的。有請王嘯總。王嘯:這波泡沫的成因,本質上是美股的持續上漲,頭部科技公司估值抬升,國內對標公司的估值水漲船高。國內看起來估值很高的公司,放到美國也就幾百億美金,而美國的頭部公司都上兆美金了。問題不是有沒有泡沫,而是泡沫能持續多久。泡沫持續得久,泡沫裡的公司,真的有可能把估值變成現實,成長為偉大的公司;就怕泡沫來了一波,擠破之後,所有人都落荒而逃。我們肯定希望泡沫能持續得久一點,那怕最後只有一小部分公司跑出來,也足夠了,納斯達克上萬家公司,最後也就跑出了“美股七姐妹”,行業本就是如此。泡沫肯定是有,最好能持續久一點,全行業都能受益。但確實有渾水摸魚的公司,什麼業務都沒有、要解決的問題都不明確,先把估值拉到極高,讓投它的人一起把泡沫做實,這是非常危險的,最終一定會水落石出。我們必須警惕這種純炒概念的公司。第二,回到VC的本質,VC就是別人告訴你,“我十年後要做成一家百億美金的公司,現在估值一億人民幣,你投我一千萬”,本質上就是買夢想、買預期,你說這是不是泡沫?VC的本質就是在投有價值的泡沫,三個人的初創公司,什麼都沒做,拿了一千萬融資,估值一個億,這就是VC日常在做的事,只是其中只有一小部分,能最終成長為偉大的公司。我們基金通過組合投資,能賺到相對穩定的回報,本質上就是在投夢想。泡沫不是現在才有,VC做的所有事,都會有一定程度的泡沫,只是大小、結構性的區別。我們反而怕結構性沒有泡沫,市場只看收入和利潤,那科技創業就會非常難。現在沒有盈利也能融資、也能上市,企業才能做長期的研發投入,壘高自己的壁壘,才有機會成長為偉大的科技公司。第三,投資過程中,一定要小心被情緒裹挾。如果有項目明顯是衝著騙投資來的,這就完全不合適了。我們還是要回歸業務本身,看項目的落地可能性,而不是靠“別人要投了,你再不投就沒額度了”這種邏輯,來推高估值。估值的增長,必須靠階段性的成果、明確的目標落地、團隊的成長來支撐,靠焦慮感推高估值的項目,註定走不遠。泡沫到底高不高,核心看終局空間和當前價格的倍數關係,而不是絕對價格,這是我的幾個核心看法。張楠:謝謝王嘯總,總結下來就是,啤酒泡沫可以享受,肥皂泡沫必須警惕,尤其是一戳就破的那種。有請楊總。楊瑞榮:每隔幾年,市場就會提起泡沫,泡沫是經濟周期裡不可避免的環節。去年年底我看了一本書,是美國一家避險基金的首席風控官寫的,大概叫 Engines that move Market(《泡沫逃生》)。 這家基金在網際網路泡沫時期成功避開了所有陷阱,最終成長為美國頭部基金。書裡回顧了工業革命以來,蒸汽機、鐵路、電報、電話、電燈,汽車,再到網際網路,每一次技術革命,都給社會帶來了巨大價值,但也都伴隨著泡沫和投資陷阱。裡面有個核心觀點:每一次泡沫出現的時候,所有人都會說一句話——This time is different,這一次跟以前不一樣了。在泡沫裡,不管是創業者還是投資人,都會跟你說,這次不一樣,我們沒有泡沫,和過去完全不同。而這句話,恰恰是最需要警惕的時候。作為投資人,核心判斷力,就是分清這次到底和以前的陷阱,有沒有本質區別。對我們而言,核心的判斷標準,就是在醫療領域,這個項目能不能創造真正的價值,能不能給患者帶來實際的獲益。無論市場泡沫如何,我們都堅守這條原則,不管是社會價值,還是國家戰略導向,核心都是創造真實價值。張楠:謝謝。今天時間關係,我們的話題討論就到這兒,有點意猶未盡。現在請各位嘉賓,寫下本場你們心中的MVP,我來統計票數,看看誰是今天聊得最好的嘉賓。因為我們是6位嘉賓,最終出現了平局。現在我宣佈:本場的MVP,由國科嘉和陳洪武陳總,和九合創投王嘯王總共同獲得!謝謝二位,有請二位舉牌,我們合影留念。 (投中網)
黃仁勳的感慨正在成真
英國《經濟學人》近日刊文指出,中國正在全球AI人才競逐中逐步擴大對西方國家的領先優勢。輿論在予以關注的同時,紛紛解析中國的吸引力何在。多年來,發達國家對開發中國家的人才虹吸近乎碾壓。這些年,隨著中國綜合國力躍升與科研環境持續最佳化,全球人才流動逐漸轉向,“最大規模海歸潮”悄然出現。同時,一些西方國家出於政治私利,動輒對全球人才關上大門,客觀上也推動了人才洋流“一路向東”。近五年來,不僅海外留學人員回國就業人數逐年增加,不少領軍人物也選擇來華任職任教。更重要的是,中國已默默搭好“如何留人”的生態系統。人工智慧競爭,本質是算力、資料與演算法的“鐵三角”之爭。在晶片受限的相對被動局面下,中國AI經歷了從“大力出奇蹟”到“精益求精”的轉變,探索出一條“軟體定義算力、演算法驅動效能、人工智慧+賦能場景”的創新路徑。完善的工程體系、海量的優質資料、充沛的算力資源、豐富的應用場景,為天下英才提供了廣闊舞台。而對夢想上路時的成本焦慮與風險挑戰,相關政策給予穩穩支援,各類人才計畫為早期AI創新力量搭建了專業化、全周期的賦能平台。中國在AI人才競爭中佔有優勢,靠的不僅是攬才、留才,更是強大的本土造血能力。中國高度重視教育,擁有全球規模最大的教育體系,各級教育普及程度達到或超過中高收入國家平均水平。資料顯示,中國人才資源總量達2.2億人,其中高技能人才超7200萬人,科學家與工程師規模接近2000萬人;每年培養STEM專業畢業生超過500萬人,全球領先。這都為中國造就了領先全球的AI人才底座。以嶄露頭角的DeepSeek團隊為例,這支平均年齡僅20多歲的生力軍,核心成員均為本土培養,充分證明中國高等教育體系與科研環境已具備培養、吸引並成就世界級AI人才的深厚土壤。當然,人才之戰不是百米衝刺,而是一場漫長的馬拉松。前段時間,國務院印發《關於深入實施“人工智慧+”行動的意見》,明確提出到2030年人工智慧全面賦能高品質發展。此外,八部門聯合發文,提出要“超常規”建構領軍人才培養新模式。當然,也要看到,中國AI在“從0到1”的原創突破上仍有差距。要鼓勵弄潮兒心無旁騖試錯深耕,尤須營造更加包容寬鬆的創新環境,糾正科研領域的實用主義傾向。“美國絕對有可能在AI上落後於中國,因為人才在變。”輝達創始人黃仁勳曾如是感慨。AI人才“東流”無須大驚小怪,人才流向改變更不是終點。持續建構創新創業的優質生態圈,讓各類人才的創造活力競相迸發、聰明才智充分湧流,中國必能擁抱更廣闊的星辰大海。 (長安街知事)
國家級背書!中國信通院牽頭測試,DeepSeek V4改寫中國AI格局
近日,信通院正式官宣——啟動DeepSeek V4的國產化適配測試工作,這釋放了什麼訊號?簡單說,它是工信部直屬的科研事業單位,毫無疑問的“國家隊”!咱們平時聽到的5G、工業網際網路相關的產業規劃、技術標準,很多都有它的身影。這次由它牽頭做適配測試,真正的“國家級背書”,一劑強心針。這事其實早有鋪墊。還記得4月24號,DeepSeek剛發佈V4預覽版,就同步開源了——不管是智能體能力、世界知識,還是推理性能,在國內和開源領域都是頂尖水平。更關鍵的是,它分了兩個版本,開發者只要改個參數,就能直接呼叫API,門檻特別低。最讓人驚喜的是,發佈當天,多家國產硬體廠商就火速跟進,搞起了“0day適配”。說白了就是當天發佈、當天適配,一點不拖沓。這可不是簡單的“能運行”,而是真正的軟硬體協同最佳化,能把國產晶片的算力潛能充分發揮出來,從根本上解決咱們以前“有晶片、無生態”的難題。咱們來看看這些廠商的動作有多快:華為計算直接宣佈,昇騰超節點全系列產品都支援。DeepSeek V4,雙方深度協同,把芯模技術做到了無縫銜接。華為雲也不甘落後,首發適配,開發者不用自己部署,一鍵就能呼叫V4的API,特別方便。不止華為,其他國產晶片廠商也沒閒著。寒武紀當天就基於vLLM推理框架,完成了V4兩個版本的適配。摩爾線程在國產全功能GPU上,率先實現了對V4最新算子庫的支援。更有份量的是,全球智能體風向標OpenClaw,也官宣全面接入,還把V4 Flash當成了默認大模型。這就相當於,咱們的國產大模型,已經得到了全球行業風向標等級的認可,不再是“閉門造車”。再說說這次信通院牽頭的適配測試,可不是走過場。測試依託專門的重點實驗室和專業的測試工具,覆蓋了晶片、伺服器、開發框架等所有AI軟硬體產品,聚焦推理、微調這些核心流程,從易用性、性能、成本等多個維度做評估,形成了一套全方位的評測體系,就是要客觀檢驗適配效果,推動模型和硬體真正做到深度協同。結合之前中美科技脫鉤、中國限制美資滲透的背景,再看這次的適配測試,其實邏輯特別清晰:美國一邊搞資本封鎖,一邊卡我們晶片脖子,就是想讓我們的AI產業斷檔。但我們沒有被動挨打,反而主動發力。我個人覺得,這才是最硬氣的破局之路。以前我們可能還會依賴國外的晶片和資本,但現在,我們有了DeepSeek V4這樣的頂尖模型,有華為、寒武紀這些國產硬體廠商的全力配合,還有信通院這樣的“國家隊”牽頭護航,相當於把AI產業的“命脈”,牢牢握在了自己手裡。以前我們可能還會有僥倖心理,現在徹底清醒了:核心技術買不來、求不來,只能靠自己。而DeepSeek V4的國產化適配,就是我們打破封鎖、實現自主可控的重要一步。 (W侃科技)
講真,DeepSeek V4+Claude Code 就是中國最強 Agent
DeepSeek V4(預覽版)終於在四月底來了!眾望所歸啊。去年 V3 發佈之後大家就開始猜 V4 什麼時候出。之所以周期這麼長,原因很簡單——換卡了,V4 的整個訓練框架都切到了昇騰。要知道,DeepSeek 的深度思考模式,絕對是當時的大模型第一梯隊,甚至是引領者。從 V3 到 V4,這一步真不容易(我接觸到不少小夥伴都不抱期待了)。不管怎麼說,總算是來了。不誘於譽,不恐於誹,率道而行,端然正己。V4 端上來了,V4.1 就快了,威武,哦不,V5 肯定要不了這麼久。注意,V4 這次是全量上線,不需要排隊等資格,直接改 API 裡的 model 參數就可以用。Pro 版改成 deepseek-v4-pro,flash 版改成 deepseek-v4-flash,deepseek-chat 和 deepseek-reasoner 到 7 月 24 號就棄用了。定價方面,pro 比較貴,但 flash 一如既往地親民。在沒有 Coding Plan 的情況下,pro 完成一次開發,價格能接受,但略貴。別的廢話我就不多說了,直接開測。咱就不去寫什麼 demo 了,直接把 DeepSeek V4 接入到 Claude Code 中讓他猛猛幹活。01、Claude Code + DeepSeek V4講真,Claude Code+DeepSeek V4 就是國產最強 Agent。切換模型很簡單,我自己寫了個工具 PaiSwitch,銷售點一點,Claude Code 的底層模型就切到了 DeepSeek V4 Pro。切換底層模型後,重新打開一個終端,輸入 /claude 啟動。可以用 /status 確認下配置是否生效。提示詞:派聰明的聊天入口 http://localhost:9527/#/chat 現在是單窗口模式,我想改成多窗口——能開新對話,舊對話直接歸檔。V4 上來先把整個項目的程式碼結構讀了一遍。讀完之後給了一個改造計畫。要新增那些結構、更新什麼類、重構那塊儲存、頁面佈局怎麼調,都列得明明白白。我全程盯著 token 消耗。讀了那麼多程式碼,加上輸出計畫的量,一塊多。然後開始幹活。V4 規劃了五個任務,先攻後端,再弄前端。後端改了 7 個檔案,前端 5 個,前後大概 15 分鐘。編譯直接過了,有錯誤自己也修了。然後我讓它自己用 CDP 連到 Chrome 跑測試。提示詞:你自己能否 cdp 我的 Chrome 測試一下:http://localhost:9527/#/chat點點按鈕,驗證功能。測出問題自己修。修完繼續測歸檔功能。最後我還讓它最佳化了一下佈局。從頭到尾,Pro 一共花了 10 塊左右。能接受。當然了,有一說一,前端審美這塊確實還比較糙。佈局能用但說不上優雅。功能方面是沒出一點問題。一個好的模型,配上 Claude Code 這種頂級 Harness 架構,能幹的事情就很多了。Claude Code之所以牛X,就是因為。它不只是把你的提示詞轉發給模型,還在中間加了任務拆解、檔案讀寫、終端操作、自動糾錯這些能力。所以同一個 Harness 換不同的底層模型,就能直觀地看出模型之間的差距在那。10 塊錢完成一個完整的功能開發,從程式碼到測試到修 bug,這個成本不算貴。但也不便宜,注意上圖中的小子,下半年卡升級後,pro的加個會大幅下調。很期待下一個版本。02、派聰明 RAG 接入 DeepSeek V4由於我們派聰明RAG做了模型管理。所以我第一時間,也是把 Pro 和 Flash 接上去體驗了一下。問了一模一樣的問題:「派聰明是什麼?」Flash 的回答是這樣的:派聰明是一個企業級的 RAG(檢索增強生成)知識庫項目,最初是技術派實戰項目中用於和 AI 大模型聊天對話的部分(不含檢索增強),後來獨立發展並沿用“派聰明”名稱,旨在延續正宗的皇家血脈。Pro 的回答是這樣的:派聰明是一個企業級 RAG(檢索增強生成)知識庫系統,基於企業文件實現精準的智能問答與知識管理。它最初是技術派實戰項目中的 AI 聊天模組(不含檢索增強),後獨立發展並沿用“派聰明”名稱,旨在延續項目的正統性。系統核心能力包括:文件自動解析與分塊、豆包 Embedding 向量化、關鍵詞與語義混合檢索、基於 DeepSeek 模型的生答、Self-RAG 自驗證機制、JWT+RBAC 多租戶權限隔離、SSE 流式推送等。通過全鏈路閉環,它有效解決知識分散與更新滯後問題,避免大模型“幻覺”,可應用於客服、培訓、合規審查等場景。派聰明完全開源(MIT 協議),教學託管在技術派平台,支援企業私有化部署與二次擴展。一個簡略,一個詳細。畢竟 Pro 啟動參數 49B,Flash 只有 13B,差了將近 4 倍。但重點不在誰答得長。RAG 場景裡,檢索質量才是天花板,模型能力決定的是在這個天花板下能發揮幾成。Flash 的回答雖然短,但核心資訊都抓到了——項目來源、名稱由來、定位。Pro 多出來的那些內容(Self-RAG、JWT+RBAC、SSE 流式推送),其實全都是從知識庫裡檢索出來的原始文件內容,它只是組織得更完整。換句話說,如果你的知識庫文件質量高、分塊合理,Flash 完全夠用。03、DeepSeek V4 值得聊的一點傳統 Transformer 的注意力機制,每個 token 要和前面所有 token 都算一遍相似度。上下文能從 10 萬拉到 100 萬,這是長上下文一直跑不起來的根本原因。DeepSeek 的解法是把注意力拆成兩種,交替堆疊起來用。第一種叫 CSA,全名 Compressed Sparse Attention,壓縮稀疏注意力。它的邏輯是先把每 4 個 token 的 KV 快取合併成一條摘要,然後用 Lightning Indexer 快速估算相關性,讓每個 query 只從這些摘要裡挑出最相關的 top-1024 個去算。DeepSeek V4 pro繪圖第二種叫 HCA,全名 Heavily Compressed Attention,重度壓縮注意力。每 128 個 token 才合併成一條,但不做稀疏選擇,所有壓縮後的摘要全部參與計算。HCA 的定位是維持全域視野,保證模型不會丟了對整段文字的把控。再加一個 128 token 的滑動窗口管局部依賴。也就是說,CSA 負責精細化檢索,HCA 負責全域審視,滑動窗口管好眼前。可以這樣理解這個設計:讀一本 1000 頁的書,傳統注意力是把每一頁和前面所有頁都對比一遍,翻到第 1000 頁的時候要同時記住前 999 頁的細節,腦容量直接爆炸。CSA 的做法是把每 4 頁貼一張便簽紙,唯寫摘要,然後看到某一頁時只去翻最相關的 1024 張便簽紙。HCA 的做法更絕——每 128 頁才貼一張便簽紙,但所有便簽紙都看一眼。再加上手裡的那一頁(滑動窗口),局部細節、中程邏輯、全域脈絡都有了,但腦容量得消耗只有原來的十分之一。04、DeepSeek 真的很克制最讓我意外的是 DeepSeek 官方這次的措辭。公告裡是這樣寫的:使用體驗優於 Sonnet 4.5,交付質量接近 Opus 4.6 非思考模式,但仍與 Opus 4.6 思考模式存在一定差距。沒有「吊打」,沒有「碾壓」,沒有「遙遙領先」。在充斥著「超越 GPT」「全球最強」「里程碑式突破」的當下,這種「我們確實還差一截」的表態真的很真誠。「不誘於譽,不恐於誹,率道而行,端然正己。」V4 不是一個完美的模型。就我自己的使用體感下來看,前端這塊的處理我認為還是有很大進步空間的。這種實心的線條來佈局,有點回到返璞歸真的。😄下一版不急,按你的節奏來。 (沉默王二)
黃仁勳急了!留給輝達的時間不多了!丟了中國市場,意味著徹底輸掉整個AI技術堆疊!
這兩天黃仁勳的訪談刷得到處都是,刷短影片、看公眾號,到處都在剪他那句“很可怕”的片段。大部分號都在說,老黃急了,少賺中國市場的錢,慌了。還有的在渲染對抗,說他怕了華為,怕了中國的晶片。我一開始也沒當回事,直到找了完整的兩個小時訪談,一字一句啃完,才發現幾乎所有人都看錯了。他急的根本不是少賺那幾百億營收,甚至不是怕華為的晶片追上他。他真正慌到骨子裡的,是放棄中國市場,等於直接把整個AI技術鏈條的未來,拱手讓人了。01. 黃仁勳最怕的是失去迭代能力前幾年我還在網際網路公司做ToB產品經理,那時候我們團隊接了個任務,要做一款給工廠用的生產管理工具。一開始我們幾個產品經理關在會議室裡憋方案,天天對標國外最頂尖的同類軟體,把人家的功能拆得稀碎,想著做個更牛逼的出來,肯定能爆。結果產品上線三個月,連十個付費客戶都沒拉到。我們幾個都懵了,功能明明比別人全,價格還便宜,怎麼就沒人用?後來老闆急了,把我們全趕去工廠駐場,讓我們別在辦公室裡瞎想,就跟著車間的工人、廠長待著,看他們到底怎麼幹活,到底需要什麼。我在浙江一個汽配廠待了快一個月,才明白我們之前做的東西,就是個空中樓閣。我們想的是“功能全不全”,人家想的是“車間裡的工人小學文化,能不能三步就操作明白”;我們想的是“資料統計多精準”,人家想的是“能不能提前預警機器故障,別耽誤半夜的生產進度”。就這麼著,我們天天泡在工廠裡,聽客戶提各種細碎的、甚至我們之前覺得“不值一提”的需求,改一版,給人家試,有問題再改,前前後後磨了快半年。最後這款我們當初根本看不上的、“一點都不高大上”的產品,成了公司之後三年裡最穩的營收支柱。也是那時候我才懂一個道理:一款產品、一項技術,能一直往前走,核心根本不是你在實驗室裡能憋出多牛逼的技術,而是有沒有持續的、真實的需求,推著你迭代。02. 市場從來不是什麼提款機是技術迭代的養料,是你活下去的根很多人覺得,中國市場對輝達來說,就是每年幾百億的營收,沒了就沒了,大不了少賺點,反正全球還有別的市場。但只有真正做過技術、跑過市場的人,才懂這個市場的價值,根本不是錢能衡量的。現在的中國,是全球最大、最活躍的AI應用市場,沒有之一。你能想到的所有AI落地場景,這裡都有最旺盛的需求。工廠裡的AI質檢,港口裡的無人調度,城市裡的智慧交通,還有數不清的網際網路公司、創業團隊,每天都在用AI做各種各樣的嘗試。這裡有全球近一半的AI開發者,他們每天都在跟晶片打交道,提需求,找bug,想辦法把晶片的性能榨到極致。輝達的晶片為什麼能一直領先?真的是他們的工程師天生比別人聰明嗎?不是的。是全球無數的開發者、無數的企業使用者,在用他們晶片的過程中,不斷地給他們反饋,不斷地提出新的要求,逼著他們一代一代地最佳化,一代一代地突破。你把這個市場放棄了,等於主動把自己的耳朵堵上了,眼睛蒙上了。你聽不到最前沿的需求了,看不到技術落地的真實問題了,你的技術迭代,自然就慢了。03. 你越想靠封鎖把對手摁死越容易把對手逼成你最不想看到的樣子我想起前幾年華為被斷供GMS的時候,我身邊好幾個在國外工作的朋友,用的華為海外版手機,一夜之間連Google地圖、信箱都用不了,那時候全網都在說,華為的海外市場徹底涼了。誰能想到,幾年過去,鴻蒙起來了?不是華為天生就想砸進去幾千億,去做一個完全自研的作業系統。是你把人家現成的路堵死了,人家除了自己開一條新路,別無選擇。你以為封鎖能摁死人家,結果反而幫人家把所有的退路都斷了,逼著人家只能往前衝,最後長出了你最忌憚的本事。這種事,歷史上發生過太多次了。當年美國給日本汽車加高額關稅,限制進口,想保住本土車企,結果豐田直接跑到美國建廠,針對美國人的需求改車型,反而在美國徹底紮下了根。當年歐美對中國搞太陽能封鎖,結果現在中國太陽能企業佔了全球90%以上的市場份額,人家連湯都喝不上了。黃仁勳在這個行業裡摸爬滾打了三十年,把一家快倒閉的公司做成了全球巨頭,他比誰都懂這個道理。你不讓輝達的晶片進中國,中國的企業就不用AI晶片了嗎?不可能的。需求就在那裡擺著,你不供應,自然有人供應。原本大家有現成的輝達晶片用,不會拼了命去搞全端自研,結果你一禁售,直接把所有人的路徑依賴都打破了。逼著中國的企業,從晶片設計,到架構,到模型,再到開發工具,一點點把整個AI的鏈條都打通了。等人家把整個生態都建起來了,全行業都習慣了用人家的東西,你再想進來,就一點機會都沒有了。04. 市場才是一個企業真正的護城河很多人看到黃仁勳說“只要能讓我們參與競爭,我們的晶片性能會遠勝華為,肯定能贏”,都在罵他自大,吹牛逼。但我看完訪談,反而覺得這是他最清醒的地方。他不是覺得輝達的技術有什麼天生的光環,永遠不會被超越。他是知道,真正的護城河,從來不是政策給你築起來的壁壘,不是你把對手擋在市場外面,自己躲在溫室裡過日子。真正的護城河,是你在充分的市場競爭裡,一點點磨出來的本事。是你天天跟對手貼身肉搏,天天被使用者的需求逼著往前走,練出來的,別人抄不走的能力。我見過太多企業,靠著地方保護,靠著政策壁壘,在自己的小圈子裡過得舒舒服服,十幾年都沒遇到過像樣的競爭。結果一放開市場,外面的對手一進來,瞬間就垮了。為何?因為太久沒打過仗了,你連使用者真正要什麼都不知道了。你所有的優勢,都是別人給你的,不是你自己練出來的。就像一個人,一輩子都待在溫室裡,從來沒淋過雨,沒吹過風,看起來白白淨淨,一出門,一場風雨就扛不住了。黃仁勳怕的,根本不是華為的晶片現在有多強。他怕的是,輝達被擋在中國市場外面,失去了最大的競爭陣地,失去了最前沿的需求反饋,慢慢就失去了迭代的動力。而華為在全球最大的AI市場裡,天天被使用者逼著跑,天天在跟市場磨合,遲早會長出能跟你正面抗衡的能力。真正能讓你站穩腳跟的,從來不是沒有競爭的安穩,不是把對手擋在門外的壁壘。是你在一次次的真實需求裡,一次次的貼身競爭裡,磨出來的本事。是你不管環境怎麼變,都能接住需求、解決問題的能力。黃仁勳那段刷屏的話,說到底,根本不是什麼中美晶片戰,也不是什麼大佬之間的博弈。他說的是商業世界裡最樸素的一個道理:你能服務多大的市場,接住多大的需求,你就能走多遠。那些靠高牆築起來的優勢,終有一天會被市場的洪流沖垮。只有在真實的世界裡,在一次次的打磨裡沉澱下來的本事,才能陪你走到最後。 (關山敘)
DeepSeek V4 震撼發佈!帶來的不僅是性能怪獸,更是中國AI的長期主義
不誘於譽,不恐於誹,率道而行,端然正己。2026年4月24日,全球AI圈期待已久的DeepSeek V4終於正式發佈!這一次,DeepSeek不僅帶來了技術上的重大突破,更重要的是,它標誌著中國大模型發展邁入了全新的階段。雙版本齊發,性能比肩頂級閉源模型此次DeepSeek V4發佈採用了"頂配+性價比"的雙版本策略:DeepSeek-V4-Pro:性能怪獸參數規模:1.6T總參數,49B啟動參數核心優勢:Agent能力達到開源模型最佳水平世界知識儲備大幅領先其他開源模型,僅稍遜於Gemini-Pro-3.1在數學、STEM、競賽型程式碼測評中超越所有已公開的開源模型內部評測顯示:使用體驗優於Sonnet 4.5,交付質量接近Opus 4.6非思考模式DeepSeek-V4-Flash:經濟之選參數規模:284B總參數,13B啟動參數核心優勢: 推理能力接近Pro版本在簡單Agent任務上與Pro旗鼓相當更快捷、經濟的API服務百萬上下文成為"標配"從今天開始,1M(一百萬)上下文長度將成為DeepSeek所有官方服務的標配。一年前,百萬上下文還是Gemini的獨家王牌,而今天,DeepSeek通過技術創新將這一"高端功能"變成了"水電煤"般的基礎設施。技術創新實現突破DeepSeek V4開創了一種全新的注意力機制,通過以下技術創新大幅降低了計算和視訊記憶體需求:混合注意力架構:結合壓縮稀疏注意力(CSA)和高度壓縮注意力(HCA)流形約束超連接:增強傳統殘差連接,提高訊號傳播穩定性Muon最佳化器:加速收斂,提升訓練穩定性DSA稀疏注意力:在token維度進行壓縮,實現高效長上下文處理資料對比:DeepSeek-V4-Pro相比前代V3模型,FLOPs降低73%,KV快取大小減少90%。攜手華為昇騰,打破技術封鎖此次發佈最大的亮點之一,就是DeepSeek V4將採用華為昇騰晶片。從CUDA到CANN的轉變過去幾年,中國大模型開發高度依賴輝達GPU和CUDA生態。而DeepSeek V4的反向操作令人矚目:完全運行在華為最新AI晶片上(主要為Ascend 950PR)從CUDA生態轉向CANN框架的軟體架構適配Agent能力專項最佳化DeepSeek V4針對當前最火的Agent應用場景進行了專門最佳化:適配主流Agent產品:Claude Code、OpenClaw、OpenCode、CodeBuddy等程式碼任務表現突出:在Agentic Coding評測中達到開源模型最佳水平文件生成能力提升:能夠高品質完成各類文件創作任務官方發佈的PPT生成示例顯示,V4-Pro在Agent框架下的表現已經相當成熟。API同步更新,開發者友好即時可用官網和App:登錄chat.deepseek.com或官方App即可體驗API服務:修改model_name為deepseek-v4-pro或deepseek-v4-flash即可呼叫介面相容:支援OpenAI ChatCompletions介面與Anthropic介面重要提示舊有API介面的兩個模型名deepseek-chat與deepseek-reasoner將於三個月後(2026年7月24日)停止使用。當前階段,這兩個模型名分別指向deepseek-v4-flash的非思考模式與思考模式。開源同步發佈,踐行開放承諾DeepSeek延續了其開源傳統,V4預覽版同步開源:Hugging Face:https://huggingface.co/collections/deepseek-ai/deepseek-v4ModelScope:https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4技術報告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf行業影響與意義DeepSeek V4的發佈對中國AI產業具有深遠意義:技術路徑的自主創新從跟隨CUDA生態到建構基於國產硬體的完整技術堆疊,為行業發展提供了新路徑。性能與成本的雙重突破在性能比肩頂級閉源模型的同時,保持了極具競爭力的成本優勢。開源生態的建設者通過持續開源高品質模型,推動了整個開源AI社區的發展。AGI目標的務實探索正如DeepSeek在發佈稿中所說:"我們將始終秉持長期主義的原則理念,在嘗試與思考中踏實前行,努力向實現AGI的目標不斷靠近。"寫在最後在過去的幾個月裡,關於V4何時發佈、是否跳票、是否被超越的傳言在AI圈來回傳播。但DeepSeek沒有回應任何傳言,而是選擇在某個周五的上午,默默地將V4放出來,同步開源,同步上線所有服務。"不誘於譽,不恐於誹,率道而行,端然正己。"這不僅是DeepSeek的態度,也應該是中國AI產業發展的寫照。DeepSeek V4的發佈,讓我們看到了中國AI在技術創新、生態建設、產業協同方面的巨大潛力。未來,讓我們期待更多這樣的突破。 (半山AI進化論)
聯手華為!DeepSeek V4改寫中國AI底座!
DeepSeek V4發佈即刷屏!成本暴降,百萬上下文,Agent增強,聯手華為、寒武紀適配中國國產算力……它正在告訴市場:大模型競爭已經不再只是榜單競爭,而是開始進入更殘酷的成本效率競爭、算力適配競爭和生態入口競爭。V4真的來了4月24日DeepSeek發佈兩個最新模型版本:DeepSeek-V4-Pro和DeepSeek-V4-Flash。體驗地址:chat.deepseek.com或DeepSeek官方APPAPI文件:https://api-docs.deepseek.com/zh-cn/guides/thinking_mode開源連結https://huggingface.co/collections/deepseek-ai/deepseek-v4https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4技術報告:https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf根據DeepSeek官方介紹,V4-Pro採用MoE架構,總參數規模為1.6T,啟動參數49B;V4-Flash總參數284B,啟動參數13B。兩個版本都支援100萬token上下文。這個組合很有意思:Pro負責沖高,Flash負責走量。一個承擔能力天花板,一個承擔規模化呼叫入口。這說明DeepSeek並不是簡單地把模型繼續做大,而是在開始拆分不同的商業場景。對複雜推理、程式碼、Agent任務、長文件處理,可以用Pro;對高頻呼叫、低成本接入、日常應用,可以用Flash。這套打法背後有一個很清晰的判斷:未來大模型不會只有一個“最強模型”包打天下,而會形成分層呼叫體系。我們嘗試用pro模式,搭建了一個給使用者抽獎的大轉盤H5,全程就5分鐘直接可用:低成本+高品質,才是未來企業正在需要的。畢竟企業真正需要的,不是每一次請求都呼叫最貴、最強的模型,而是在不同任務之間找到能力、成本和響應速度的平衡點。DeepSeek開始把模型做成一組可調度、可分層、可商業化組合的AI基礎設施。成本暴降73%在100萬token上下文設定下,DeepSeek-V4-Pro相比DeepSeek-V3.2,單token推理FLOPs只需要27%,KV Cache只需要10%。換句話說,也就是長上下文推理中的計算量壓力大幅下降;KV Cache只剩10%,意味著視訊記憶體和快取壓力也被明顯壓縮。過去大家討論長上下文,很容易只看“能不能放進去”,100萬token聽起來很震撼,但真正的問題不是能不能塞進去,而是塞進去之後還能不能高效地算、穩定地跑、便宜地用。上下文越長,推理成本、視訊記憶體佔用、響應延遲都會迅速放大。尤其是在企業場景裡,模型需要讀合同、讀程式碼庫、讀制度檔案、讀會議紀要、讀歷史工單。一次任務不只是問一句話,而是連續讀取、理解、規劃、執行、修正。如果長上下文成本下不來,Agent就只能停留在演示視訊裡。所以V4這次主攻的就是在100萬token場景下繼續壓低計算壓力。畢竟模型能力越強,呼叫越頻繁,成本控制越重要。AI不再只是“能不能用”的問題,而是“能不能每天用、多人用、長期用、低成本用”的問題。誰能把單位推理成本壓得更低,誰就更接近真實的規模化入口。讓Agent更像工作系統100萬上下文真正改變的是Agent的工作邊界。DeepSeek API文件顯示,V4-Flash和V4-Pro均支援1M上下文,最大輸出可達384K,並支援JSON Output、Tool Calls、Chat Prefix Completion等能力。這些功能指向的是一個更明確的方向:DeepSeek不是只想做聊天模型,而是在繼續向任務型模型、工具型模型、Agent底座推進。對企業來說,長上下文意味著什麼?對程式碼場景,它可以一次性理解更大範圍的程式碼庫、需求文件和歷史修改記錄。對金融、法律、諮詢場景,它可以處理更長的研報、合同、紀要、制度檔案和客戶材料;對知識庫場景,它可以減少過度切片、錯誤召回、上下文斷裂帶來的資訊損耗;對於Agent場景,它可以讓模型在更長任務鏈條裡保持連續性,不至於走幾步就忘記前因後果……這才是百萬上下文真正的商業含義,它不是讓AI多背一點東西,而是讓企業流程第一次有機會被更完整地交給模型處理。過去很多AI應用看起來很聰明,但一到真實工作流就掉鏈子。原因很簡單:真實工作不是單點問答,而是一組連續任務。而Agent要變成生產系統,首先得具備連續工作的能力。DeepSeek V4這次把長上下文、工具呼叫、結構化輸出放在同一條線上,說明它要搶的已經不是聊天入口,而是企業流程裡的執行入口。聯手華為,底座開始換代路透社4月24日報導稱,華為表示,基於昇騰950 AI晶片的Ascend supernode將全面支援DeepSeek V4系列模型。這是里程碑式的節點,說明中國的模型公司和算力公司開始進入更深層的協同最佳化。過去,無論訓練、推理、部署、工具鏈,“輝達”都處在產業鏈的核心位置。但到了V4這一輪,情況開始發生變化。當模型開始為國產晶片、國產軟體棧、國產叢集做適配,AI競爭就不再只是演算法團隊之間的比賽,而是模型、晶片、編譯器、推理框架、開發者生態之間的系統協同。這才是屬於中國的“強強聯手”!據華為2025年年報顯示,公司實現全球銷售收入8809億元人民幣,淨利潤680億元人民幣;2025年研發投入達到1923億元,佔全年收入21.8%,近十年累計研發投入超過1.382萬億元。華為押注AI計算,不是一次短期熱點跟進,而是長期研發投入和產業生態建設的結果。DeepSeek V4如果能在昇騰體繫上跑得更穩、更便宜、更可規模化,就不只是DeepSeek自己的勝利,也是在驗證國產AI算力能否承接下一代模型應用。未來國產算力公司比拚的不會只是晶片峰值性能,而是誰能更快適配模型,誰的軟體棧更穩定,誰能支撐企業級推理服務,誰能在開發者生態裡站住位置。晶片只是起點;能用起來,才是門檻;能被反覆呼叫,才是價值。價格戰之後是“生態戰”R1時代,DeepSeek已經讓全球AI行業重新審視中國模型的成本效率,到了V4,DeepSeek並沒有放棄這張牌,而是開始把低價策略做得更分層。根據DeepSeek API文件,V4-Flash每百萬token價格為:快取命中輸入0.028美元,快取未命中輸入0.14美元,輸出0.28美元;V4-Pro對應為:快取命中輸入0.145美元,快取未命中輸入1.74美元,輸出3.48美元。V4-Flash繼續承擔低成本入口,適合大量高頻、通用、響應速度敏感的場景;V4-Pro則承擔複雜任務和高價值呼叫,價格明顯更高,但也提供更強的推理、長上下文和Agent能力。這說明DeepSeek已經不是簡單做“價格屠夫”,它正在從單一低價策略,轉向“能力分層+價格分層+場景分層”。當開發者、企業客戶、雲廠商、晶片廠商、Agent平台都圍繞一個模型系列搭建流程時,競爭就不再只是一次API呼叫的價格,而是誰能成為默認選項。AI行業最終比的不是一次發佈時的熱度,而是誰能嵌入更多應用、更多工具、更多工作流。DeepSeek V4的真正野心,可能不是再造一個“最強聊天機器人”,而是成為中國AI應用生態裡的底層介面之一。V4是否可以封神?雖然模型榜單很重要,但企業真正關心的是另外一組指標:延遲、穩定性、並行能力、SLA、工具呼叫精準率、私有化部署成本、安全合規,以及在複雜業務流程中的可控性。再強的模型,如果頻繁超時、呼叫不穩、工具執行出錯,企業仍然很難大規模使用。華為、寒武紀的適配是關鍵進展,但開發者生態、框架相容、叢集調度、推理效率、故障定位、工程工具鏈,都需要長期驗證。真正的產業替代,不是靠一句口號完成的,而是在一次次模型更新、一次次客戶部署、一次次複雜任務運行中磨出來的。所以,V4真正的考場不在發佈當天,而在接下來的幾個月。它能不能穩定服務開發者?能不能支撐複雜Agent任務?能不能在國產算力上跑出足夠好的效率?能不能讓企業願意長期呼叫?這些問題,比“刷屏”更重要。AI下半場,拼的是穩定交付回頭看DeepSeek這一年,它最重要的作用,不只是做出了強模型,而是不斷改變行業的計分方式。過去,大模型行業喜歡比參數、比榜單、比發佈會震撼程度。DeepSeek出現後,大家開始更認真地討論訓練成本、推理成本、開源效率、模型蒸餾、國產算力適配。這一次V4繼續往前推了一步。它讓行業看到,下一階段AI競爭至少有四個核心變數:1.模型能力還要繼續提升:沒有能力,其他都沒有意義。2.推理成本必須繼續下降:成本降不下來,Agent和企業應用都難以規模化。3.上下文和工具呼叫要走向生產級:模型不能只會聊天,還要能理解流程、呼叫工具、完成任務。4.算力底座要形成可替代路徑:如果模型能力始終被單一硬體生態鎖住,中國AI的自主性就始終不完整。這四個變數合在一起,才是DeepSeek V4真正釋放的訊號,它不是一次孤立的模型升級,而是中國AI開始圍繞成本、算力、工具鏈和生態重新組織競爭。畢竟AI下半場,單點突破可能不夠了。真正的競爭會落到更具體的地方:單位推理成本、算力調度效率、軟體棧成熟度、開發者遷移成本、企業長期呼叫意願。DeepSeek V4在提醒整個行業:AI的勝負,正在從“誰更聰明”,變成“誰能把聰明穩定、便宜、可複製地交付出去”。 (AI科技銳評)